Описание проекта

Вы решили открыть небольшое кафе в Москве. Оно оригинальное — гостей должны обслуживать роботы. Проект многообещающий, но дорогой. Вместе с партнёрами вы решились обратиться к инвесторам. Их интересует текущее положение дел на рынке — сможете ли вы снискать популярность на долгое время, когда все зеваки насмотрятся на роботов-официантов?
Вы — гуру аналитики, и партнёры просят вас подготовить исследование рынка. У вас есть открытые данные о заведениях общественного питания в Москве.

Инструкция по выполнению проекта

Шаг №1. Загрузите данные и подготовьте их к анализу

Загрузите данные о заведениях общественного питания Москвы. Убедитесь, что тип данных в каждой колонке — правильный, а также отсутствуют пропущенные значения и дубликаты. При необходимости обработайте их.
Путь к файлу: /datasets/rest_data.csv

Шаг №2. Анализ данных

Сделайте общий вывод и дайте рекомендации о виде заведения, количестве посадочных мест, а также районе расположения. Прокомментируйте возможность развития сети.

Шаг №3. Подготовка презентации

Подготовьте презентацию исследования для инвесторов. Для создания презентации используйте любой удобный инструмент, но отправить презентацию нужно обязательно в формате pdf. Приложите ссылку на презентацию в markdown-ячейке в формате:
Презентация: <ссылка на облачное хранилище с презентацией>
Следуйте принципам оформления из темы «Подготовка презентации».

Описание данных

Таблица rest_data:

Содержание

Загрузка и подготовка данных к анализу

Столбец id

Данные корректны

Столбец object_name

Для дальнейшего поиска и удаления дубликатов приведем названия к нижнему регистру

Столбец chain

Данные корректны

Столбец object_type

Заменим тип "предприятие быстрого обслуживания" и "магазин (отдел кулинарии)" на более короткие - для удобного отображения на графиках, в остальном данные корректны

Столбец address

Для дальнейшего поиска и удаления дубликатов приведем названия к нижнему регистру

Солбец number

Много заведений с нулем посадочных мест, посмотрим на них

Закусочные, кулинарии, шаурма могут не иметь посадочных мест; данные корректны

Дубликаты, проверка и удаление

Вывод

Привели текстовые значения к нижнему регистру, проверили данные на корректность, пропуски и дубликаты; данные готовы к дальнейшему исследованию

Анализ данных

Изучение соотношения видов объектов общественного питания по количеству

Вывод

Ожидаемо самый распространненый вид объекта - это кафе (6071), столовых (2584) и ресторанов (2282) более чем в два раза меньше; меньше всего кулинарий (273) и закусочных (348)

Изучение соотношения сетевых и несетевых заведений по количеству

Вывод

В исследовании 12317 (81%) сетевых и 2964 (19%) несетевых заведений

Изучение вида общественного питания для сетевого распространения

Объеденим chain_count с таблицей ratio_amount по столбцу type и посчитаем долю сетевых заведений от общего числа

Вывод

Самая высокая доля сетевых заведений в фаст-фуде (42%), в кафе и ресторанах доля 23% и 24% соотвественно; сетевых столовых, буфетов или баров почти нет

Что характерно для сетевых заведений: много заведений с небольшим числом посадочных мест в каждом или мало заведений с большим количеством посадочных мест?

Для ответа на поставленный вопрос нам надо провести дополнительную обработку данных, для 20-ти самых крупных сетей проведем лемматизацию названий - создадим функцию, которая будет приводить разные названия одних и тех же сетей к одному общему

Применим функцию name_overall и соберем таблицу по названиям сетей с количеством заведений и со средним, минимальным и максимальным числом посадочных мест

Отфильтруем "сети" с числом заведений меньше 3-х и построим диаграмму рассеивания

Изучение среднего количества посадочных мест для каждого вида общественного питания

Вывод

Самый вместительный вид - столовая (103 посадочных места), что логично, т.к. столовые обслуживают места, где изначально предполагается большое количество посетителей, далее идут рестораны (80 мест); закусочные и кулинарии работаю в основном "на вынос"

Создание отдельного столбца с информации об улице из столбца address

Постройте график топ-10 улиц по количеству объектов общественного питания. Воспользуйтесь внешней информацией и ответьте на вопрос — в каких районах Москвы находятся эти улицы?

Найдем топ-10 улиц Москвы

Определение районов Москвы

Используем внешний источник и также переведем названия улиц к строчному написанию

Удалим ненужные столбцы, переименуем streetname в street и объединим таблицы top_10_f и area_msc

Вывод

Данные улицы популярны для заведений, потому большая часть из них это - "лучи" Москвы, очень длинные улицы тянущиеся от центра города до спальных районов; по ним всегда перемещается много людей, у них отличная транспортная доступность; на этих улицах много помещений пригодных для общепита

Найти число улиц с одним объектом общественного питания. Воспользоваться внешней информацией и ответить на вопрос — в каких районах Москвы находятся эти улицы?

Отфильтруем улицы с одним заведением питания

Объединим полученную таблицу с таблицей районов, удалим строки пустыми значениями

Число улиц - 563

Определим топ-10 райнов Москвы, где больше всего улиц с одним заведением питания

Вывод

Всего в Москве 563 улицы с одним заведением общественного питания; это, как правило, "периферийные" небольшие улицы, переулки или тупики, и даже если они расположены в центре им может не хватать "трафика" для открытия еще одного заведения или на этих улицах может просто не быть свободных подходящих помещений

Вывод

Рекомендации

Презентация: https://disk.yandex.ru/i/HTwjlPjESyktcg